视频可访问性对于盲人和低愿景用户来说至关重要,以获得教育,就业和娱乐的公平参与。尽管有专业和业余服务和工具,但大多数人类生成的描述都很昂贵且耗时。此外,人生成的描述的速率不能匹配视频产生的速度。为了克服视频可访问性的越来越多的空白,我们开发了两个工具的混合系统到1)自动生成视频的描述,2)提供响应于视频上的用户查询的答案或附加描述。与26例盲和低视力下的混合方法研究结果表明,当两种工具在串联中使用时,我们的系统会显着提高用户理解和享受所选视频的理解和享受。此外,参与者报告说,在呈现自生物的描述与人类修订的自动化描述相关时,没有显着差异。我们的结果表明了对发达系统的热情及其承诺提供对视频的定制访问。我们讨论了当前工作的局限性,并为自动视频描述工具的未来发展提供了建议。
translated by 谷歌翻译
IoT设备收集的数据通常是私人的,并且在各种用户之间具有巨大的多样性。因此,学习需要使用可用的代表性数据样本进行预训练,在物联网设备上部署预训练的模型,并使用本地数据在设备上调整已部署的模型。这种用于深度学习授权应用程序的设备改编需要数据和记忆效率。但是,现有的基于梯度的元学习方案无法支持记忆有效的适应。为此,我们提出了P-Meta,这是一种新的元学习方法,该方法可以强制执行结构的部分参数更新,同时确保快速概括到看不见的任务。对几片图像分类和强化学习任务的评估表明,与最先进的几次适应方法相比。
translated by 谷歌翻译
时间序列预测在城市生活中广泛应用,从空气质量监测到交通分析。但是,准确的时间序列预测是具有挑战性的,因为现实世界中的时间序列遇到了分配转移问题,在该问题中,它们的统计属性会随着时间而变化。尽管对域适应或概括的分布变化的广泛解决方案,但它们在未知的,不断变化的分布变化中无法有效发挥作用,这在时间序列中很常见。在本文中,我们提出了超时性预测(HTSF),这是一个基于超网络的框架,用于在分配变化下预测准确的时间序列。 HTSF以端到端的方式共同学习时间变化的分布和相应的预测模型。具体而言,HTSF利用超层来学习分布移位的最佳表征,从而为主层生成模型参数以进行准确的预测。我们将HTSF实施为可扩展的框架,可以结合不同的时间序列预测模型,例如RNN和Transformers。对9个基准测试的广泛实验表明,HTSF达到了最先进的表现。
translated by 谷歌翻译
新兴的边缘情报应用程序要求服务器重新训练和更新部署在远程边缘节点上的深神经网络,以利用新收集的数据示例。不幸的是,由于高度严格的通信资源,在实践中可能不可能连续向这些边缘节点发送全面更新的权重。在本文中,我们提出了重量的深层部分更新范式,该范式巧妙地选择了一小部分权重以在每个服务器到边缘通信中进行更新,同时与完整更新相比实现了相似的性能。我们的方法是通过分析上限的部分更新和完整更新之间的损失差异来建立的,并且只能更新权重,从而对上限产生最大的贡献。广泛的实验结果证明了我们部分更新方法的功效,该方法在更新少量的权重的同时,可以达到高推理精度。
translated by 谷歌翻译